Scholar Hub/Chủ đề/#học máy nâng cao/
Học máy nâng cao, thuộc lĩnh vực trí tuệ nhân tạo, nghiên cứu hệ thống cải thiện từ dữ liệu, sử dụng kỹ thuật phức tạp cho bài toán khó. Các thuật toán nổi bật gồm học sâu, mạng nơ-ron tích chập, học tăng cường. Ứng dụng rộng rãi trong y tế, tài chính, giao thông, giúp chẩn đoán bệnh, phát hiện gian lận, phát triển xe tự hành. Dù đối mặt thách thức về dữ liệu lớn và đạo đức, sự phát triển không ngừng của công nghệ hứa hẹn mang lại đột phá, cần sự hợp tác giữa các chuyên gia để tối đa hoá tiềm năng.
Giới Thiệu Về Học Máy Nâng Cao
Học máy nâng cao là một lĩnh vực của trí tuệ nhân tạo (AI) tập trung vào việc xây dựng và nghiên cứu các hệ thống có khả năng học tập và cải thiện hiệu suất từ dữ liệu. Khác với học máy cơ bản, học máy nâng cao tích hợp những kỹ thuật và phương pháp phức tạp hơn để xử lý lượng dữ liệu lớn và giải quyết các bài toán khó trong thực tế.
Các Thuật Toán và Phương Pháp Học Máy Nâng Cao
Trong học máy nâng cao, nhiều thuật toán và phương pháp mới được phát triển và sử dụng, bao gồm:
- Học Sâu (Deep Learning): Sử dụng mạng nơ-ron nhân tạo với nhiều lớp, cho phép máy tính học tập từ dữ liệu đa dạng và phức tạp hơn. Đây là nền tảng của các ứng dụng như nhận diện hình ảnh, xử lý ngôn ngữ tự nhiên và phân tích video.
- Mạng Nơ-ron Tích Chập (Convolutional Neural Networks - CNNs): Thường được sử dụng trong xử lý ảnh và video, CNNs giúp tự động trích xuất các đặc điểm từ hình ảnh và hỗ trợ nhận diện hình học hiệu quả.
- Mạng Nơ-ron Tái Phát (Recurrent Neural Networks - RNNs): Phù hợp với dữ liệu tuần tự, RNNs thường được áp dụng trong xử lý ngôn ngữ và chuỗi dữ liệu thời gian như phân tích âm thanh hoặc chuỗi ký tự.
- Học Tăng Cường (Reinforcement Learning): Tập trung vào việc huấn luyện các tác nhân (agent) thông qua tương tác với môi trường để tối ưu hóa một chiến lược hoặc hành động nhằm đạt được phần thưởng tối đa.
Các Ứng Dụng Thực Tiễn
Ứng dụng của học máy nâng cao lan rộng trong nhiều lĩnh vực khác nhau, chẳng hạn như:
- Y Tế: Phân tích dữ liệu y tế để chẩn đoán bệnh, cá nhân hóa điều trị và dự báo xu hướng sức khỏe cộng đồng.
- Tài Chính: Phát hiện gian lận, phân tích rủi ro đầu tư và giao dịch tự động.
- Giao Thông: Phát triển xe tự hành, quản lý lưu thông thông minh và tối ưu hóa chuỗi cung ứng.
Thách Thức và Tương Lai
Học máy nâng cao đối mặt với nhiều thách thức như xử lý dữ liệu lớn, yêu cầu tính toán cao và vấn đề đạo đức trong việc sử dụng dữ liệu. Tuy nhiên, với sự tiến bộ không ngừng của công nghệ, học máy nâng cao hứa hẹn mang đến những đột phá quan trọng trong tương lai, góp phần thúc đẩy sự phát triển bền vững và cải thiện chất lượng cuộc sống.
Việc nghiên cứu và ứng dụng học máy nâng cao cần sự hợp tác giữa các nhà khoa học dữ liệu, kỹ sư phần mềm và các chuyên gia trong những lĩnh vực liên quan. Sự hợp tác này sẽ giúp tận dụng tối đa tiềm năng của học máy nâng cao, mở ra những khả năng mới cho thế giới tương lai.
Phân tích hóa học và sinh học về hormone gây rối loạn nội tiết và hoạt tính estrogen trong một nhà máy xử lý nước thải nâng cao Dịch bởi AI Environmental Toxicology and Chemistry - Tập 27 Số 8 - Trang 1649-1658 - 2008
Tóm tắtCác hormone steroid estrone (E1), 17β‐estradiol (E2), estriol (E3), 17α‐ethinylestradiol (EE2), và các dạng liên hợp của chúng đã được khảo sát trong một nhà máy xử lý nước thải nâng cao (STP). Nồng độ estrogen trong mẫu nước và bùn, được thu thập vào tháng 10 năm 2004 và tháng 4 năm 2005, đã được xác định bằng phương pháp sắc ký khí-spectrometric khối lượng và sắc ký lỏng-spectrometric khối lượng giai đoạn tandem. Đồng thời, hoạt tính estrogen được định lượng bằng cách sử dụng các dòng tế bào đáp ứng estrogen (MELN) để điều tra hành vi của tổng thể các hợp chất estrogen. Nồng độ estrogen tại đầu vào dao động từ 200 đến 500 ng/L, với tỷ lệ các dạng liên hợp chiếm hơn 50%. Các estrogen chính trong nước thải đầu vào là E1 và E3. Hoạt tính estrogen dao động trong khoảng từ 25 đến 130 ng/L tương đương E2 (EEQs). Nồng độ estrogen và hoạt tính estrogen đo được ở đầu vào và trong nước thải đã qua xử lý sơ bộ tương tự nhau, cho thấy tác động yếu của quá trình xử lý sơ bộ đối với việc loại bỏ hormone. Ngược lại, cả nồng độ estrogen và hoạt tính estrogen đều giảm trong quá trình xử lý sinh học, với hiệu suất loại bỏ cao (>90%). Estrone, E2, và EE2 tồn tại trong nước đã xử lý dưới 10 ng/L, trong khi hoạt tính estrogen thấp hơn 5 ng/L EEQs. Lưu lượng khối lượng estrogen trong nước thải ra và bùn đại diện cho dưới 2% và 4%, tương ứng, của đầu vào. Do đó, phần của estrogen được hấp phụ vào bùn là rất nhỏ, và sự phân hủy sinh học là phương thức chính để loại bỏ estrogen. Cách tiếp cận kết hợp này, so sánh phân tích hóa học và sinh học, cho phép chúng tôi xác nhận rằng hầu hết hoạt tính estrogen xảy ra trong STP này, chủ yếu nhận nước thải sinh hoạt, là do hormone giới.
Phân loại đất nâng cao bằng học máy thông qua việc tích hợp dữ liệu lỗ khoan và thử nghiệm thâm nhập CPTU với việc lọc tiếng ồn Dịch bởi AI Bulletin of Engineering Geology and the Environment - Tập 80 - Trang 9157-9171 - 2021
Việc tích hợp dữ liệu lỗ khoan và thử nghiệm thâm nhập piezocone (CPTU) trong việc xác định đặc điểm địa điểm giúp đạt được hiểu biết toàn diện hơn về điều kiện mặt đất. Tuy nhiên, các loại đất tại các địa điểm CPTU và lỗ khoan gần đó có thể không luôn nhất quán. Sự hiện diện của dữ liệu nhiễu hoặc các lớp đất mỏng sẽ làm sai lệch việc diễn giải dữ liệu CPTU trong phân loại loại đất và đánh giá các thuộc tính đất. Nghiên cứu này đề xuất một phương pháp học máy kết hợp để tích hợp dữ liệu lỗ khoan và CPTU dưới một khuôn khổ Bayes nghiêm ngặt và để xác định, phân tách dữ liệu CPTU nhiễu mà không cần phán xét chủ quan, điều này góp phần vào việc phân loại đất và đánh giá thuộc tính đất đáng tin cậy hơn. Loại đất được báo cáo từ lỗ khoan và dữ liệu CPTU được coi là hai loại bằng chứng cho loại đất thực sự. Một sự chuyển tiếp bên của loại đất từ vị trí CPTU đến vị trí lỗ khoan được cho phép để nắm bắt sự khác biệt về loại đất. Phương pháp đề xuất được áp dụng trong việc xác định đặc điểm địa điểm biển của cầu Hồng Kông - Chu Hải - Ma Cao bắc qua cửa sông Châu Giang của Trung Quốc. Các lớp đất được nhúng trong các tầng đất chính đã được phát hiện thành công, tạo ra một hồ sơ đất đáng tin cậy hơn và diễn giải các thuộc tính đất tương thích hơn với thực tiễn kỹ thuật. Thêm vào đó, việc tích hợp dữ liệu lỗ khoan và CPTU giảm thiểu đáng kể sự không chắc chắn về lớp địa tầng trong việc xác định đặc điểm địa điểm.
#Phân loại đất #Dữ liệu lỗ khoan #Thử nghiệm thâm nhập CPTU #Học máy #Lọc tiếng ồn #Đặc điểm địa điểm
ÁP DỤNG HỌC MÁY ĐỂ NÂNG CAO ĐỘ CHÍNH XÁC CHO DỰ ĐOÁN NGUY CƠ ĐA DI TRUYỀN VỚI DỮ LIỆU RỐI LOẠN PHỔ TỰ KỶĐiểm nguy cơ đa di truyền (polygenic risk scores, PRS) là một giá trị ước lượng tương đối nguy cơ mắc bệnh dựa vào việc xác định tập hợp các biến dị di truyền ảnh hưởng. Trong những năm gần đây, đã có nhiều cố gắng đưa tính toán PRS ứng dụng vào lâm sàng, tuy nhiên việc lựa chọn các biến dị di truyền ảnh hưởng đến bệnh có độ chính xác chưa cao dẫn đến hiệu quả mô hình chưa đạt kỳ vọng. Trong nghiên cứu này, chúng tôi đã thực nghiệm các mô hình khác nhau để chọn ra tập hợp các biến dị cho giá trị dự đoán tốt nhất. Dữ liệu được sử dụng là dữ liệu trong các nghiên cứu tương quan toàn hệ gen (Genome-Wide Association Studies, GWAS) về rối loạn phổ tự kỷ (Autism Spectrum Disorder, ASD). Tập hợp các biến dị ban đầu được thu gọn bằng phương pháp nhóm và đặt ngưỡng (Clumping and Thresholding, «C + T»), hồi quy logistic phạt (Penalized Logistic Regression, PLR), và loại bỏ đặc trưng đệ quy dựa trên máy vec-tơ tựa (Support Vector Machine Recursive Feature Selection, SVM-RFE). Kết quả cho thấy phương pháp SVM-RFE đưa ra được một tập SNPs mà mô hình dự đoán đạt hiệu năng tốt nhất.
#Bệnh đa di truyền #điểm nguy cơ đa di truyền #GWAS #SNPs #mảng SNP #học máy #bệnh tự kỷ
Tiềm năng thu nhận từ vựng ngẫu nhiên từ việc nghe các bài giảng học thuật về khoa học máy tính: một nghiên cứu điển hình dựa trên tập hợp dữ liệu giáo dục đại học từ Ma Cao. Dịch bởi AI Frontiers in Psychology - Tập 14 - Trang 1219159 - 2023
Các trường đại học ở các quốc gia không nói tiếng Anh ngày càng áp dụng các bài giảng bằng tiếng Anh như phương tiện giảng dạy (EMI). Dường như có một giả định rằng hiệu suất của sinh viên trong các kỳ thi tiếng Anh tiêu chuẩn có thể được coi là tương đương với kiến thức từ vựng cần thiết để hiểu các bài giảng EMI bất kể lĩnh vực chuyên môn. Đối với những từ không quen thuộc mà sinh viên gặp phải, người ta giả định rằng chúng có thể được thu nhận qua việc nghe các bài giảng này. Tiềm năng cho sinh viên thu nhận những từ không quen thuộc một cách ngẫu nhiên trong khi nghe các bài giảng này vẫn chưa được khám phá đầy đủ.
#EMI #case study #computer science #corpora #incidental vocabulary acquisition #lectures
Các phương pháp học máy dựa trên dữ liệu để dự đoán khả năng thấm và nguy cơ ăn mòn trong bê tông lai kết hợp xỉ lò cao và tro bay Dịch bởi AI Asian Journal of Civil Engineering - - Trang 1-13 - 2024
Nghiên cứu này nhằm xác định mô hình học máy phù hợp nhất để dự đoán khả năng thấm và chỉ số điện thế nửa cell của bê tông lai chứa các tỷ lệ khác nhau của xỉ lò cao và tro bay khi tiếp xúc với môi trường giàu chloride. Thiết kế phối trộn tuân thủ các tiêu chuẩn IS 10262:2019, và các mẫu beam bê tông lai, có thanh gia cố lồi, được chế tạo với kích thước 150 × 150 × 700 mm. Tiếp theo, các mẫu này đã trải qua quá trình bảo dưỡng 28 ngày trong nước có nồng độ NaCl 3,5%, mô phỏng sự tiếp xúc với chloride có thể gây ăn mòn bằng cách xâm nhập vào bê tông hướng đến các thanh thép được chôn vào. Khả năng thấm và cường độ nén của bê tông lai được đánh giá bằng cách đúc 36 khối hình lập phương kích thước 150 mm sau 28 ngày bảo dưỡng. Các thử nghiệm điện thế nửa cell được thực hiện trên các mẫu beam bê tông lai đã được tiếp xúc với môi trường chloride để tạo ra tập dữ liệu sử dụng cho mô hình học máy nhằm dự đoán khả năng thấm trong bê tông. Các giá trị khả năng thấm đã được dự đoán và so sánh bằng 3 mô hình học máy, tức là Adaboost, random forest, và XGBoost. Đặc biệt, AdaBoost đã thể hiện độ chính xác đáng kể, cho thấy các mối tương quan mạnh mẽ giữa các giá trị thực tế và giá trị dự đoán. Các phát hiện của nghiên cứu này tương quan và đơn giản hóa quá trình phát hiện ăn mòn trong bê tông, cuối cùng hỗ trợ trong việc phát triển các hệ thống giám sát ăn mòn chính xác và mạnh mẽ hơn.
#học máy #khả năng thấm #bê tông lai #xỉ lò cao #tro bay #ăn mòn #giám sát
Máy phát điện nano triboelectric dựa trên ionogel có khả năng co giãn cao, dẫn điện và hoạt động ở nhiệt độ rộng Dịch bởi AI Nano Research - Tập 16 - Trang 11638-11645 - 2023
Sự phát triển nhanh chóng của các sản phẩm điện tử đeo trên người mang đến những thách thức đối với nguồn cung cấp năng lượng tương ứng. Trong nghiên cứu này, một máy phát điện nano triboelectric dựa trên ionogel (SI-TENG) ổn định về nhiệt và có khả năng co giãn được đề xuất để thu thập năng lượng sinh học. Độ dẫn điện ion của ionogel đã tăng lên tới 0.53 S·m−1 thông qua việc điều chỉnh tối ưu lượng polyamid nhánh cực (NH2-HBP), cùng với độ biến dạng cao lên đến 812%, khả năng phục hồi co giãn tuyệt vời, và dải nhiệt độ hoạt động rộng từ −80 đến 250 °C. SI-TENG với ionogel này làm điện cực và cao su silicone vừa là lớp triboelectric vừa là lớp bao bọc cho thấy sự ổn định nhiệt độ cao, khả năng co giãn và khả năng giặt rửa tốt. Bằng cách thêm một lượng hợp lý nano SiO2 vào lớp triboelectric, hiệu suất đầu ra được cải thiện thêm 93%. Hoạt động ở chế độ điện cực đơn với tần số 1.5 Hz, đầu ra của một SI-TENG có diện tích 3 cm × 3 cm lần lượt là 247 V, 11.7 µA, 78 nC và 3.2 W·m−2. Nó được sử dụng làm nguồn cung cấp năng lượng tự sạc để nạp một tụ điện 22 µF lên 1.6 V trong 167 giây bằng cách vỗ tay và sau đó cấp điện cho máy tính điện tử. Hơn nữa, SI-TENG cũng có thể được sử dụng như một cảm biến chuyển động tự cấp nguồn để phát hiện biên độ và tần số của các chuyển động như gập ngón tay, nuốt, gật đầu và lắc đầu thông qua phân tích điện áp đầu ra.
#máy phát điện nano triboelectric #ionogel #năng lượng sinh học #co giãn #độ dẫn điện #cảm biến chuyển động
BÀI HỌC TỪ SỰ CỐ HƯ HỎNG MÁY CẮT 500kV VÀ GIẢI PHÁP NÂNG CAO TUỔI THỌ MÁY CẮT ĐIỆN CHO KHÁNG ĐIỆN BÙ NGANG Việc nghiên cứu ứng dụng thiết bị điều khiển đóng/mở đã được các công ty điện lực rất quan tâm nhằm giảm thiểu ảnh hưởng của quá trình quá độ khi đóng/mở các tải phản kháng. Máy cắt điện 500kV là một thiết bị quan trọng và đắt tiền trong trạm biến áp. Khi mở máy cắt đối với các kháng điện bù ngang cần được nghiên cứu, tính toán cẩn thận vì điều khiển mở máy cắt không chính xác có thể dẫn đến hiện tượng đánh lửa trở lại, thậm chí có thể gây hư hỏng máy cắt. Bài báo tiến hành phân tích sự cố hư hỏng máy cắt điện 500kV khi mở kháng điện tại trạm biến áp 500kV Hiệp Hòa, đồng thời đề xuất các giải pháp giảm hư hỏng máy cắt khi mở kháng điện trong tương lai.
#Circuit breaker #Controlled Switching Device #Re-ignition #Shunt reactor #SynchroTeq.
Nâng cao Quyết định của Con người với các Trợ giúp Quyết định Tạo ra Bằng AI Dịch bởi AI Computational Brain & Behavior - Tập 5 - Trang 467-490 - 2022
Quyết định của con người thường gặp phải nhiều sai lầm hệ thống. Nhiều trong số các sai lầm này có thể tránh được bằng cách cung cấp các trợ giúp quyết định hướng dẫn người ra quyết định chú ý đến thông tin quan trọng và tích hợp nó theo một chiến lược quyết định hợp lý. Thiết kế các trợ giúp quyết định như vậy trước đây là một quá trình thủ công tốn thời gian. Các tiến bộ trong khoa học nhận thức có thể giúp tự động hóa quy trình này trong tương lai. Chúng tôi gần đây đã giới thiệu các phương pháp học máy để phát hiện các chiến lược tối ưu cho quy trình ra quyết định của con người một cách tự động và một phương pháp tự động để giải thích các chiến lược đó cho mọi người. Các trợ giúp quyết định được xây dựng bằng phương pháp này đã có khả năng cải thiện quy trình ra quyết định của con người. Tuy nhiên, việc theo dõi các mô tả được tạo ra bởi phương pháp này rất tốn công sức. Chúng tôi giả thuyết rằng vấn đề này có thể được khắc phục bằng cách truyền đạt chiến lược quyết định được phát hiện tự động dưới dạng một loạt các hướng dẫn bằng ngôn ngữ tự nhiên về cách thức đưa ra quyết định. Thí nghiệm 1 đã chỉ ra rằng mọi người thực sự hiểu các hướng dẫn quy trình như vậy dễ dàng hơn so với các trợ giúp quyết định được tạo ra bởi phương pháp trước đó của chúng tôi. Khuyến khích bởi phát hiện này, chúng tôi đã phát triển một thuật toán để dịch đầu ra của phương pháp trước đó của chúng tôi thành các hướng dẫn quy trình. Chúng tôi đã áp dụng phương pháp cải tiến để tự động tạo ra các trợ giúp quyết định cho một nhiệm vụ lập kế hoạch tự nhiên (tức là, lập kế hoạch cho một chuyến đi đường) và một nhiệm vụ quyết định tự nhiên (tức là, chọn một khoản thế chấp). Thí nghiệm 2 cho thấy rằng các trợ giúp quyết định được tạo ra tự động này đã cải thiện đáng kể hiệu suất của mọi người trong việc lập kế hoạch cho một chuyến đi đường và chọn một khoản thế chấp. Những phát hiện này gợi ý rằng việc tăng cường dựa trên AI có thể có tiềm năng để cải thiện quy trình ra quyết định của con người trong thế giới thực.
#quyết định con người #các lỗi hệ thống #trợ giúp quyết định #học máy #tự động hóa #hướng dẫn quy trình #lập kế hoạch #thế chấp
Ứng dụng của học máy và IoT để nâng cao an toàn cho trẻ em trong môi trường gia đình Dịch bởi AI Springer Science and Business Media LLC - Tập 78 Số 8 - Trang 10357-10384 - 2022
An toàn cho trẻ em là điều vô cùng quan trọng trong mọi môi trường gia đình. Khi IoT kết hợp với học máy, nó mang lại những lợi ích to lớn trong việc tạo ra những ngôi nhà thông minh và an toàn cho xã hội. Mục tiêu của nghiên cứu này là áp dụng các mô hình học máy để phát hiện những bất thường trong tập dữ liệu thu thập từ ba thiết bị IoT. Các thông số môi trường mà bất thường được phát hiện bao gồm phát thải khói, chiếu sáng, phát thải khí LPG, phát thải CO, phát hiện chuyển động, thay đổi độ ẩm và thay đổi mức nhiệt độ. Nghiên cứu này sử dụng ba mô hình học máy, bao gồm K-Means clustering, Isolation Forest và Inter-Quartile Range để phát hiện các bất thường. Ngoài ra, nó cũng sử dụng mô hình Facebook Prophet để dự đoán các xu hướng hàng ngày trong dữ liệu được dự đoán bởi ba mô hình trên. Đánh giá hiệu suất cho thấy độ chính xác trong việc dự đoán sự bất thường cao hơn cho mô hình Inter-Quartile Range khi so với hai mô hình học máy còn lại. Độ chính xác đạt được bởi mô hình IQR là 99% trong khi các mô hình K-means và Isolation Forest đạt độ chính xác 94% mỗi mô hình. Nghiên cứu cũng cung cấp một sơ đồ phần cứng như một phần của công việc tương lai có thể được thực hiện nhằm hiện thực hóa an toàn cho trẻ em một cách tốt hơn trong tương lai gần.
#trẻ em #an toàn #IoT #học máy #phát hiện bất thường #môi trường gia đình
Phân tích và nâng cao video của bài trình bày trên slide điện tử Dịch bởi AI Proceedings. IEEE International Conference on Multimedia and Expo - Tập 1 - Trang 77-80 vol.1
Bài báo này trình bày một phương pháp mới để đánh chỉ mục video của các bài thuyết trình sử dụng các slide điện tử. Bằng cách xác định hình ảnh các slide trong các khung hình video, và sau đó ghép nối chuỗi video với các slide điện tử gốc, video có thể được đánh chỉ mục và tìm kiếm, và sự xuất hiện hình ảnh của các đoạn có thể được cải thiện. Trước tiên chúng tôi phát hiện "khu vực nội dung" trong các khung hình video bằng phương pháp bình phương tối thiểu có trọng số dựa trên sự tương đồng màu sắc. Bằng cách theo dõi "sự khác biệt về nội dung" giữa các khung hình liên tiếp, chúng tôi tạm thời phân đoạn video thành các chuỗi hiển thị cùng một slide. Vì việc khác biệt hóa này loại bỏ các hiệu ứng hình ảnh cấp thấp, chúng tôi có thể liên kết các đoạn video với slide bằng cách khớp sự khác biệt nội dung của các đoạn video liền kề với sự khác biệt nội dung của tất cả các cặp slide có thể có. Bằng cách xác định xác suất chuyển tiếp của các đoạn video, chúng tôi có thể giải quyết vấn đề khớp này một cách hiệu quả trong hai bước, đầu tiên là tìm các khớp có khả năng cao, sau đó sử dụng lập trình động cho phần còn lại chưa khớp. Sau khi khớp, sự tương ứng với các slide gốc có thể được sử dụng để cải thiện chất lượng video trình bày trong khu vực nội dung, và cũng có thể được sử dụng để đánh chỉ mục và tổng hợp. Các thí nghiệm cho thấy hiệu suất cao của phân vùng và khớp trên một số video trình bày khác nhau rất nhiều về màu sắc và phong cách nền.
#Phân đoạn hình ảnh #Phát hiện cạnh hình ảnh #Đánh chỉ mục #Phương pháp bình phương tối thiểu #Khoa học máy tính #Chuỗi video #Giám sát #Hiển thị #Máy ảnh #Truy xuất dựa trên nội dung